IA Física: Inferencia Batch-1 de LLMs - Memoria vs Ancho de Banda Descubre el gap de inferencia en IA física: memoria limitada pero no ancho de banda. CUDA Graphs muestra un overhead oculto en GPUs rápidas como H100. 2026-06-01 · 2 min